检索结果

Select

1. 结合BERT和特征投影网络的新闻主题文本分类方法

张海丰, 曾诚, 潘列, 郝儒松, 温超东, 何鹏

《计算机应用》唯一官方网站 2022, 42 (4): 1116-1124. DOI: 10.11772/j.issn.1001-9081.2021071257

摘要（575）

HTML （37）

PDF （1536KB）（262）

针对新闻主题文本用词缺乏规范、语义模糊、特征稀疏等问题，提出了结合BERT和特征投影网络（FPnet）的新闻主题文本分类方法。该方法包含两种实现方式：方式1将新闻主题文本在BERT模型的输出进行多层全连接层特征提取，并将最终提取到的文本特征结合特征投影方法进行提纯，从而强化分类效果；方式2在BERT模型内部的隐藏层中融合特征投影网络进行特征投影，从而通过隐藏层特征投影强化提纯分类特征。在今日头条、搜狐新闻、THUCNews-L、THUCNews-S数据集上进行实验，实验结果表明上述两种方式相较于基线BERT方法在准确率、宏平均F1值上均具有更好的表现，准确率最高分别为86.96%、86.17%、94.40%和93.73%，验证了所提方法的可行性和有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 结合广义自回归预训练语言模型与循环卷积神经网络的文本情感分析方法

潘列, 曾诚, 张海丰, 温超东, 郝儒松, 何鹏

《计算机应用》唯一官方网站 2022, 42 (4): 1108-1115. DOI: 10.11772/j.issn.1001-9081.2021071180

摘要（389）

HTML （14）

PDF （728KB）（208）

传统的机器学习方法在对网络评论文本进行情感极性分类时，未能充分挖掘语义信息和关联信息，而已有的深度学习方法虽能提取语义信息和上下文信息，但该过程往往是单向的，在获取评论文本的深层语义信息过程中存在不足。针对以上问题，提出了一种结合广义自回归预训练语言模型（XLNet）与循环卷积神经网络（RCNN）的文本情感分析方法。首先，利用XLNet对文本进行特征表示，并通过引入片段级递归机制和相对位置信息编码，充分利用了评论文本的语境信息，从而有效提升了文本特征的表达能力；然后，利用RCNN对文本特征进行双向训练，并在更深层次上提取文本的上下文语义信息，从而提升了在情感分析任务中的综合性能。所提方法分别在三个公开数据集weibo-100k、waimai-10k和ChnSentiCorp上进行了实验，准确率分别达到了96.4%、91.8%和92.9%。实验结果证明了所提方法在情感分析任务中的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 基于会话的多粒度图神经网络推荐模型

任俊伟, 曾诚, 肖丝雨, 乔金霞, 何鹏

《计算机应用》唯一官方网站 2021, 41 (11): 3164-3170. DOI: 10.11772/j.issn.1001-9081.2021010060

摘要（503）

HTML （25）

PDF （682KB）（231）

基于会话的推荐旨在根据当前用户的匿名会话的点击序列信息来预测用户的下一次点击行为。现有方法多数都是通过对用户会话点击序列的物品信息进行建模，并学习物品的向量表示，进而进行推荐。而作为一种粗粒度的信息，物品的类别信息对物品有聚合作用，可作为物品信息的重要补充。基于此，提出了基于会话的多粒度图神经网络推荐模型（SRMGNN）。首先，使用图神经网络（GNN）得到会话序列中的物品和物品类别的嵌入向量表示，并使用注意力网络捕捉用户的注意力信息；然后，将赋予了不同注意力权重值的物品和物品类别信息进行融合后，输入到门限循环单元（GRU）里；最后，通过GRU学习会话序列的物品时序信息，并给出推荐列表。在公开的Yoochoose数据集和Diginetica数据集上进行实验，实验结果验证了该模型在增加了物品类别信息后的优势，且实验结果表明了在Precision@20和MRR@20这2种评价指标上，该模型相较于短期注意力/记忆优先级（STAMP）模型、神经注意力（NARM）模型、GRU4REC等8种模型均有更好的效果。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 基于用户网络嵌入的民宿房源推荐方法

刘彤, 曾诚, 何鹏

计算机应用 2019, 39 (11): 3398-3402. DOI: 10.11772/j.issn.1001-9081.2019040721

摘要（375）

PDF （793KB）（258）

随着民宿行业的迅速发展，在线民宿订房系统开始流行起来。让用户在海量房源信息中快速找到所需房源是订房系统中待解决的问题。针对房源推荐中用户冷启动与数据稀疏性的问题，提出基于网络嵌入法的房源个性化推荐（UNER）方法。首先通过用户在系统中的历史行为数据及标签信息构建两类用户网络；然后基于网络嵌入法将网络映射至低维向量空间中，得到用户节点的向量表示并通过用户向量计算用户相似度矩阵；最后依据该矩阵为用户进行房源推荐。实验数据来源于贵州"水东乡舍"民宿订房系统。实验结果表明，相对于基于用户的协同过滤算法，所提方法的综合评价指标（F1）提升了20个百分点，平均正确率（MAP）提升11个百分点，体现出该方法的优越性。

参考文献 | 相关文章 | 多维度评价

Select

5. 跨项目缺陷预测中训练数据选择方法

王星, 何鹏, 陈丹, 曾诚

计算机应用 2016, 36 (11): 3165-3169. DOI: 10.11772/j.issn.1001-9081.2016.11.3165

摘要（622）

PDF （926KB）（637）

跨项目缺陷预测（CPDP）利用来自其他项目的缺陷数据预测目标项目的缺陷情况，为解决以往缺陷预测方法面临的训练数据受限问题提供了一个新的视角。训练数据的质量将直接影响跨项目缺陷预测模型的性能，因此，需尽可能选择与目标项目更相似的数据用于模型的训练。利用PROMISE提供的34个公开数据集，从训练数据选择方面，分析了四种典型的相似性度量方法对跨项目预测结果的影响以及各种方法之间的差异。研究结果表明：使用不同的相似性度量方法选出的训练数据质量不同，其中余弦相似性与相关系数两种方法效果更好，且最大改进比例达到6.7%；同时，根据目标项目的缺陷率，发现余弦相似性更适合于缺陷率高于0.25的项目。

参考文献 | 相关文章 | 多维度评价

Select

6. 一种改进的网络拓扑发现方法

邱建林，何鹏

计算机应用 2005, 25 (04): 891-893. DOI: 10.3724/SP.J.1087.2005.0891

摘要（1112）

PDF （139KB）（1226）

在对基于ICMP的网络拓扑发现、基于ARP的网络拓扑发现和利用SNMP访问MIB(管理信息库)路由表的网络拓扑发现三种方法的分析研究基础上,提出了一个经过改进的网络拓扑发现方法,此方法能够准确、完整、高效地发现网络主干拓扑和子网内的设备,并详细描述了网络拓扑发现的数据结构和算法。